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摘要 : [目的 /意义 ] 为 更 好 地 提升 基于 内 容 的 引文 分 析 效 果 , 对 国内 外 引用 对 名 相关 研究 进行 调研 总 结 ， 

为 引用 内 容 分 析 研 究 提 供 借鉴 。[ 方 法 /过 程 ] 通 过 调研 国内 外 引用 对 象 相关 研究 ,梳理 引用 对 象 的 概念 定义 、 
分 类 体系 、 应 用 领域 和 自动 化 识别 等 方面 研究 进展 ,总 结 当 前 引用 对 象 研究 不 足 并 提出 未 来 发 展 方向 。[ 结果 / 

结论 ] 引用 对 象 从 语义 层面 评价 文献 学 术 研究 的 贡献 和 利用 价值 ,为 引文 分 析 方 法 增加 了 重要 维度 。 引 用 对 象 
研究 需要 从 理论 、 技 术 和 应 用 三 个 方向 进行 深化 :理论 上 ,加 强 多 维度 引用 对 象 特 征 的 研究 和 分 析 ; 技 术 上 , 探 
EL EM 自动 化 识别 方法 ;应 用 上 ,尝试 基于 引用 对 象 的 科研 评价 服务 。 

S 关键 词 : 引用 对 象 ” 引 用 对 象 识别 ”引用 内 容 分 析 科研 评价 
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各 是 科研 他 六 成 办 的 训 让 直人 之 作者 。 用 对 象 指 的 是 引文 被 引用 的 具体 科学 内 容 , 它 直接 所 
生硬 中 全 引用 他 人 的 丰 完 记 时 SA 用 未 了 文献 间 的 本 质 联系 。 引 用 对 象 从 语义 层面 评价 文 
(dm TRIER ELEANOR Rub 07 UR DULITDEBURURUR LL A5 EA T ARA 
析 多 基础 。 传 统 引文 分 析 方 法 仅仅 考虑 引用 次 数 ,无 PAE AARRE EA RETRA 
ae et 次 的 定量 引文 分 析 方法 结合 ,从 内 容 与 数量 相 结合 的 

E cr E wena à 方式 完善 科研 评价 体系 ,是 针对 被 诉 病 多 年 的 以 计数 
ES S LI S E EE 方式 为 主 的 科研 评价 的 一 剂 良 方 ,具有 重要 的 理论 意 
挖 狐 和 分 析 ,已 有 研究 主要 围绕 引用 动机 识别 “7 a 义 和 实 际 应 用 价值 。 
tiq ^p .引用 位 置 分 析 忆 -2 .引用 内 容 主题 鉴于 引用 对 象 的 重要 意义 和 作用 ,为 了 能 够 更 全 
A 2|3c Pg Zeb .引用 内 容 分 析 框 架 研 面 地 了 解 引 用 对 象 研究 相关 进展 ,笔者 使 用 英文 "cita- 


58- 相等 方面 展开 。 这 种 揭示 引用 行为 语义 信息 的 tion , reference ”分 别 与 “object , factoid , terms , concept 
SUCDESAKT HRS HC 法 以 数量 衡量 质量 的 ”symbols context" 等 词语 进行 组 配 , 中 文 “引文 .引用 、 对 
不 足 。 有 学 者 认为 ,基于 引用 内 容 的 引文 分 析 将 成 为 。” 和 象 .内 容 , 参 考 文献 .术语 .关键 词 " 等 关键 词 进 行 组 配 ， 
下 一 代 引 文 分 析 的 方向 2 。 在 权威 学 术 网 站 和 数据 库 文献 检索 平台 进行 检索 ,对 

在 引文 分 析 向 引用 内 容 分 析 方 向 深化 的 同时 , 引 ” 相关 研究 文献 及 研究 报告 进行 深入 阅读 和 关联 阅读 ， 
用 对 象 的 概念 被 提 了 出 来 。 通 过 调研 发 现 ,引用 对 象 总结 科 技 论文 引用 对 象 相 关 研 究 进展 。 从 理论 层面 梳 
有 多 种 表述 ,如 Concept Symbols ( 概念 符号 ) ,Knowl- ” 理 引 用 对 象 基 本 概念 ,对 比 不 同 分 类 体系 差异 ;从 应 用 
edge Claims( 知识 声明 ) „Reference Terms (参考 文献 术 ”层面 总 结 引用 对 象 在 引文 分 析 和 文本 挖掘 中 的 利用 ; 
语 ) 等 ,也 有 研究 者 直接 定义 为 “引用 对 象 ” ,从 概 ” ”从 技术 层面 介绍 引用 对 象 自动 识别 方法 ,效果 和 不 足 。 
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最 后 综合 引用 对 象 研究 进展 ,分 析 当 前 研究 存在 的 问 
题 ,展望 未 来 引用 对 象 研究 的 发 展 方向 。 


2 引用 对 象 的 概念 研究 


目前 研究 者 对 引用 对 象 的 定义 并 不 统一 ,但 对 其 
本 质 认 知 高 度 一 致 , 即 在 引用 内 容 中 表达 引文 内 容 的 
对 象 , 常 以 名 词 或 名 词 术语 的 形式 表示 。 不 同学 者 给 
予 的 定义 略 有 差别 ,为 了 纵 观 引用 对 象 研究 脉络 ,笔者 
按时 间 先 后 顺序 逐一 梳理 研究 中 引用 对 象 概念 。 
引用 对 象 概念 锥 形 最 早 由 H. Small 在 1978 年 提 
出 ,H. Small 在 论文 中 详细 介绍 了 引用 对 象 的 内 涵 和 表 
现形 式 ,认为 引用 内 容 中 的 科学 内 容 (scientific con- 
tent) 是 作者 对 被 引文 献 的 内 容 进行 符号 化 的 过 程 ,以 
一 种 泛 化 的 “概念 符号 ”( concept symbols) 描述 引文 中 
的 概念 或 方法 ” 。 他 认为 这 种 概念 符号 比 引文 分 类 
更 灿 直 接地 解释 了 作者 的 引用 行为 ,具有 重要 价值 。 
CNA. Ritchie 等 利用 引文 中 术语 进行 索引 优化 时 ,把 
引 月 句 中 与 引文 相关 的 术语 称 为 参考 文献 术语 (refer- 
ence terms) ,并 对 术语 的 表现 形式 进行 分 析 20 o V. 
QEEinian 等 在 论文 摘要 任务 中 把 引用 句 里 描述 引文 主 
要 后 献 的 无 重奏 的 词组 称 为 事实 (non -overlapping con- 
tribütion fact) ”。 在 其 随后 的 论文 中 ,用 nugget 表 
示 u 半 ,含义 未 变 ,fact 和 nugget 即 为 引用 对 象 。 
会 M. H. Anderson 等 基于 H. Small 对 引用 对 象 的 描 
壕 禹 结 引文 原文 的 知识 声明 ( knowledge claims) ,并 与 
引 需 句 中 描述 引文 的 具体 内 容 进行 对 照 , 映 射 到 每 个 


者 在 引用 文献 时 提 及 引文 中 的 具体 内 容 对 象 ,由 施 引 
文献 发 起 ,是 作者 根据 研究 需要 对 引文 内 容 的 一 种 泛 
化 表示 ,具有 概括 性 和 客观 性 的 特点 。 引 用 对 象 可 能 
是 引文 中 的 具体 方法 、 工 具 \ 数 据 ` 结 果 等 对 象 (如 名 
a) ,也 可 能 是 对 引文 中 方法 、 观 点 、 应 用 或 结论 的 概括 
性 总 结 (如 句 b)。 


(a) Atomic scattering factors for the refinement of both 


structures were taken from Hanson ,et al. 

( b) Brown et al. (1993) proposed a series of statisti- 
cal models of the translation process. 

进一步 研究 科技 论文 与 其 引文 语义 层面 引用 关 
系 ,笔者 认为 其 遵循 以 下 的 基本 模型 : 

引用 关系 = | 论文 ,引用 句 ,引文 ,引用 对 象 ,引用 
频次 ，y gy ,引用 目的 ,情感 倾向 (i wos a | 

其 中 引用 句 是 指 论文 中 描述 引文 内 容 的 句子 , 引 
用 目的 表示 引用 的 动机 ,情感 倾向 包括 肯定 、 否 定 和 中 
立 , 引 用 频次 可 能 是 一 次 或 者 多 次 ,而 引用 对 象 则 是 论 
文中 描述 引文 具体 内 容 对 象 ,是 论文 与 引文 内 容 上 的 
关联 点 ,直接 表明 引文 被 利用 价值 和 学 术 贡献 。 
基于 上 述 引 用 关系 基本 模型 ,可 以 明确 看 到 ,引用 
对 象 与 引用 目的 .引用 情感 倾向 等 的 相关 关系 ,有 利于 
更 好 地 明确 引用 对 象 的 概念 。 


3 引用 对 象 的 分 类 研究 


引用 对 象 的 分 类 研究 主要 从 两 个 角度 展开 ,一 是 
对 引用 对 象 的 表现 形式 分 类 ,二 是 对 引用 对 象 的 内 容 


引 贿 句 中 的 知识 声明 即 为 引用 对 象 ”“。 许 德 山 在 其 
《 蔡 豆 论文 引用 中 的 观点 倾向 分 析 》 博 士 论文 中 ,把 引 
用 句 中 出 现 的 来 自 于 引文 的 最 大 字符 串 定义 为 引用 对 
RU, R. Jha 等 在 自动 摘要 研究 时 ,利用 引用 句 中 关 
于 引文 的 事实 (factorid) “构建 自动 摘要 模型 ,虽然 在 
文中 未 给 出 factorid 定义 ,但 笔者 观察 其 数据 集 发 现 
factorid Ej V. Qazvinian 等 定义 的 fact 含义 一 致 , 即 能 
表达 引文 内 容 的 名 词 术 语 。 

陆 伟 等 在 引文 内 容 标注 框架 研究 中 ,把 引用 对 象 
标注 体系 作为 其 研究 重点 之 一 ,定义 引用 对 象 为 作者 
在 引用 文献 时 提 及 成 果 中 的 具体 内 容 对 象 "” A. 
Khalid 等 对 比 了 引用 名 中 描述 引文 的 术语 与 采用 主题 
识别 算法 获得 的 主题 词 的 一 致 性 ,用 参考 文献 术语 
(reference terms) 表示 与 引文 相关 的 内 容 即 引用 对 
RM. 

综合 上 述 研 究 成 果 , 不 同 研究 者 对 引用 对 象 的 理 
解 基本 一 致 ,笔者 总 结 引用 对 象 概念 , 即 引用 对 象 是 作 
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分 类 。 许 德 山 按 不 同 表 现形 式 把 引用 对 象 分 为 命名 实 
体 引用 对 象 和 抽象 表述 引用 对 象 “” ,命名 实体 对 象 主 
要 以 名 词 或 名 词 短 语 等 结构 体现 的 算法 术语、 概念 、 
数据 、 软 件 等 ,抽象 表述 对 象 主要 以 句子 或 子 句 形 式 表 
示 引 文 的 观点 、 理 论 .方法 等 。 命 名 实体 引用 对 象 与 
H. Small 研究 的 “概念 符号 ”的 表现 形式 一 致 ,目前 已 
有 研究 主要 针对 命名 实体 对 象 展 开 “ 。 

从 内 容 层面 对 引用 对 象 进行 分 类 较为 复杂 , 目前 
没有 形成 统一 的 分 类 体系 ,研究 者 按照 其 对 引用 对 象 
内 容 的 理解 把 引用 对 象 分 为 5 - 11 个 类 别 不 等 ,并 通 
过 人 工 标注 实验 ,分 析 不 同类 型 引用 对 象 出 现 的 频次 
及 占 比 ,更 深入 .系统 地 揭示 引用 对 象 特点 。 

M. Garzone 分 类 体系 定义 了 5 种 类 型 引用 对 象 ,分 
别 为 “材料 .设备 .工具 “公式 “方法 程序 “条 件 、 限 
制 ”““ 结 果 分 析 方 法 "5 。R. Radoulov 对 M. Garzone 的 
体系 进行 修正 ,构建 的 分 类 体系 既 包括 表示 引用 目 
的 的 对 象 如 "研究 背景 “先驱 性 工作 “相关 工作 "等 ， 
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又 包括 具体 内 容 对 象 如 “模型 “产品 或 材料 ”数据 ” 
等 。 陆 伟 等 进一步 改进 了 R. Radoulov 的 分 类 体系 5 
据 弃 描述 引用 目的 对 象 ,增加 具象 类 型 如 "工具 ” A 
式 / 推 导 ”, 细 化 "方法 "类 为 "方法 “模型 ”和 ”算法 ”， 
保留 了 “概念 “数据 “结果 ”类 型 ,最 终 形成 11 个 类 
目的 引用 对 象 分 类 体系 。 

由 上 可 见 ,分 类 的 标准 和 细 粒 化 程度 对 分 类 体系 
影响 较 大 。 笔 者 认为 对 引用 对 象 的 分 类 应 体现 引用 对 
象 内 容 本 质 特征 ,而 非 其 在 被 引用 时 的 作用 或 目的 ,分 
类 标准 应 具有 独立 性 和 唯一 性 ,否则 容易 造成 类 目 混 
消 。 如 引用 对 象 为 某 个 “数据 集 ” ,从 施 引 文献 引用 目 
的 角度 可 能 为 了 表示 ”研究 背景 "或 "已 有 工作 ”, 混合 
两 种 分 类 标准 会 导致 同一 引用 对 象 属于 多 个 类 型 ,分 
类 结果 一 致 性 较 差 。 除 分 类 标准 不 同 ,已 有 分 类 体系 


些 问题 ,如 一 些 概念 所 属 的 类 型 在 不 同文 章 中 并 不 相 
同 ， 如 Expectation Maximization " 在 不 同 的 文章 中 被 述 
为 “方法 "或 者 “算法 ”“” 。 


4 引用 对 象 的 识别 研究 


引用 对 象 识 别 是 一 种 基于 非 结构 化 数据 的 信息 抽 
取 任 务 。 作 者 在 引用 文献 时 所 使 用 的 语言 模式 较为 灵 
活 ,在 某 些 情况 下 ,甚至 连 人 工 确认 引用 对 象 都 比较 困 
难 。 许 多 学 者 表示 ,引用 对 象 自动 识别 是 一 个 比较 困 
难 的 任务 。 目 前 引用 对 象 识 别 可 分 为 两 大 类 ， 
人 工 标注 识别 和 利用 计算 机 模型 进行 自动 化 识别 。 已 
有 研究 以 人 工 识别 为 主 ,自动 化 识别 研究 较 少 。 

4.1 人 工 识 别 
引用 对 象 人 工 识别 指 通过 人 工 标 注 的 方式 识别 引 


的 全 粒度 具有 较 大 差异 ， 如 同样 是 “方法 ”类 , 陆 伟 等 
将 i 算法 ” ea snis. 


用 句 中 的 引用 对 象 。 笔 者 从 数据 集 和 标注 规则 两 个 角 
度 梳理 H. Small, A. Ritchie, V. Qazvinian, M. H. Ander- 
son hif, R. Jha 等 学 者 的 人 工 标注 引用 对 象 方法 如 
dd 所 示 : 


表 1 人 工 标注 采用 数据 集 及 标注 规则 
数据 量 标注 规则 


R. Small 化 学 294 种 化 学 期 刊 中 前 52 篇 高 被 引 论文 和 其 ”标记 与 引文 最 相关 术语 或 短语 
全 部 引用 内 容 
ENJA. Ritchie 等 计算 机 - 计算 语言 学 篇 论文 及 其 24 条 引用 内 容 标注 引用 句 中 描述 引文 内 容 的 术语 
ij Qazvinian 等 计算 机 - 计算 语言 学 25 篇 ACL 论文 及 其 954 条 引用 内 容 阅读 每 篇 论文 的 全 部 引用 句 , 抽 取 论 文 的 主要 贡 
- 献 ; 归 一 化 不 同 标注 者 标注 的 贡献 并 与 引用 句 进行 
对 应 
(XM. H. Anderson 管理 学 1 篇 论文 及 其 496 条 引用 内 容 阅读 论文 归纳 “知识 主张 ” ,结合 496 条 引用 内 容 
e 中 的 表述 ,总 结 出 16 个 主要 引用 对 象 
“之 陆 伟 等 计算 机 20 篇 LDA 模型 论文 及 其 引用 内 容 标注 引用 内 容 中 描述 引文 具体 内 容 对 象 
FT R. Jha 等 计算 机 - 计算 语言 学 47 篇 论文 及 其 2625 条 引用 内 容 标注 引用 句 中 与 引文 相关 的 事实 (去 掉 只 出 现 一 
el 次 的 事实 ) 


(1) 数 据 集 方面 ,由 于 没有 引用 对 象 开放 数据 集 ， 
学 者 们 主要 采用 自 建 数据 集 或 利用 科技 文献 全 文 数据 
4E ,数据 内 容 主 要 包括 引文 与 其 引用 内 容 ,数据 量 方 
面 , 受 限于 人 工 标注 成 本 ,标注 数据 量 并 不 大 ,引用 对 
eE N 受到 较 多 学 者 青睐 的 计算 
机 语言 协会 数据 集 ( Association for Computational Lin- 
' 是 引文 内 容 
分 析 常 用 数据 集 之 一 , 它 提供 自然 语言 处 理 领 域 权 威 
期 刊 和 顶级 会 议 学 术 论文 全 文 , 并 建立 丰富 的 引用 网 
络 。 
(2) 标 注 规则 方面 ,基本 标注 规则 一 致 度 较 高 , 即 


guisticsAnthology Network corpus, ANN ) ? 


V. Qazvinian 等 把 所 有 相同 引文 的 引用 句 聚 集 在 一 起 
进行 统一 标注 ; M. H. Anderson 从 所 有 引用 句 中 总 结 出 
所 有 引用 对 象 再 分 配给 每 条 引用 句 。 不 同 的 标注 策略 
下 ,最 终 标注 结果 的 数据 形式 有 所 不 同 ,第 一 种 标注 策 
略 下 引用 对 象 完全 来 自 引用 句 且 表达 形式 丰富 ,后 两 
种 策略 引用 对 象 表现 形式 较为 规范 化 ,可 直接 应 用 于 
深度 引用 分 析 。 
4.2 自动 化 识别 

通过 计算 机 技术 方法 实现 引用 对 象 自动 化 识别 正 
处 于 起 步 阶段 ,R. Radoulov . 许 德 山 和 A. Khalid 三 位 研 
究 者 先后 从 引用 对 象 的 分 类 识别 和 替代 识别 三 种 不 


—- 


标注 引用 句 中 与 引文 相关 内 容 , 但 由 于 后 续 的 应 用 需 
求 不 同 ,标注 策略 有 所 不 同 。H. Small A. Ritchie 等 、 陆 
EER. Jha 等 直接 标注 每 一 条 引用 名 中 的 引用 对 象 ; 


同 角 度 进 行 探索 和 尝试 ,下 文 逐 一 梳理 这 些 技术 方法 
和 实验 效果 。 
R. Radoulov 采用 机 器 学 习 算 法 实 


引用 对 象 分 
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类 ,算法 融合 了 论文 结构 特征 ,引文 位 置 特征 .词性 特 
征 、 句 法 特征 和 两 类 线索 词 ,为 每 种 对 象 类 型 训练 朴素 
贝 叶 斯 分 类 器 模型 ,再 用 训练 好 的 模型 实现 引文 分 类 
自动 标注 。 数 据 集 包含 5 583 条 引文 数据 ,结果 显 
示 , 在 9 种 类 别 中 ,特定 背景 .数据 .方法 和 产品 4 种 类 
别 的 分 类 效果 较 好 ,准确 率 70% 以 上 ,平均 下 值 在 0.7 
-0.5 之 间 。 其 他 5 种 类 别 一 般 背景 ,相关 工作 概念、 
历史 性 说 明和 开创 性 工作 ,分 类 效果 并 不 理想 ,F 值 只 
有 0.3 左右 ,R. Radoulov 分 析 原 因 认 为 这 种 结果 是 由 
于 数据 量 不 足 导致 的 ,这 几 种 类 别 的 数据 仅 占 数据 集 
总 量 的 10% 。 从 这 个 角度 也 可 以 看 出 ,引用 对 象 的 类 
型 主要 集中 在 特定 背景 .数据 .方法 和 产品 这 4 种 类 
别 。 
本 许 德 山 分 析 科技 论文 引用 情感 链 路 时 对 引用 对 象 
进行 识别 。 识 别 方法 为 计算 引用 句 字符 串 与 引文 原文 
内 狮 的 相似 性 ,抽取 引用 句 与 引文 共同 含有 的 最 大 字 
从 曾 作 为 引用 对 象 ,实验 中 由 于 引文 全 文 获取 难度 较 
态 巫 配 工作 仅 基 于 引文 标题 ”。 实 验 语 料 由 61 篇 
科 找 文献 组 成 ,标注 语 料 去 重 后 得 到 1 076 条 引证 标 
证 最 终 正 确 识别 引用 对 象 705 个 ,正确 率 为 65.52% 。 
除 虹 用 对 象 识别 外 , 许 德 山 尝试 对 一 篇 文献 的 不 同 引 
用 到 条 进 行规 范 化 处 理 , 通 过 对 引用 对 象 词 形 相 似 度 、 
学 答 串 长 度 和 语义 相似 度 加 权 求 和 计算 同一 篇 引文 的 
两 环 引 用 对 象 是 否 为 同一 对 象 ,引用 对 象 规范 化 处 理 
稳 取 直接 影响 引用 对 象 应 用 效果 。 
CA. Khalid 通过 对 一 篇 引文 的 所 有 引用 内 容 集合 的 
主题 进行 识别 ,替代 难度 较 大 的 直接 识别 引用 对 象 工 
作 E3 他 从 ANN 论文 集中 选取 113 篇 论文 和 9 970 条 引 
用 名 ,邀请 一 名 计算 语言 学 研究 者 标注 引用 句 与 引文 
相关 的 术语 ,如 果 存 在 二 义 性 则 放弃 标注 ”9 。 随 后 ， 
在 每 篇 论文 的 引用 名 集合 上 ,采用 LDA 主题 模型 进行 
主题 识别 ,利用 词 云 为 每 个 主题 分 配 一 个 可 以 概括 主 
要 内 容 的 高 频 术 语词 作为 主题 标签 ,并 对 相同 内 容 的 
主题 进行 合并 。 最 后 评估 主题 标签 与 人 工 标注 术语 间 
的 相似 性 ,结果 表明 在 大 多 数 情况 下 ,引用 句 集合 的 主 
题词 可 以 表示 引用 名 中 的 参考 文献 术语 , 即 引用 对 象 。 
但 也 有 例外 ,如 引用 句 中 包含 多 于 一 个 引用 对 象 的 情 
况 。 

基于 引用 对 象 识别 研究 现状 的 梳理 ,该 研究 处 于 
起 步 阶段 ,没有 一 套 完整 的 研究 体系 。 在 数据 集 方面 ， 
研究 者 各 自 创 建 实验 数据 ,引用 对 象 自动 识别 目前 并 
没有 公开 测评 预料 ,不 利于 对 比 不 同方 法 下 的 识别 效 
果 。 在 技术 方法 上 ,只 有 许 德 山 真正 尝试 在 引用 内 容 
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中 抽取 引用 对 象 ,但 仅 考 虑 字符 串 匹 配 的 方法 过 于 简 
单 ,识别 效果 并 不 理想 。A. Khalid 探索 利用 LDA 模型 
生成 主题 词 代替 直接 识别 引用 对 象 ,但 该 模型 忽略 了 
词 与 词 之 间 的 顺序 ,没有 考虑 词汇 是 否 与 引文 真正 相 
关 等 问题 。 引 用 对 象 自动 化 识别 需要 更 多 的 探索 和 学 
试 。 


5 引用 对 象 在 引文 分 析 和 文本 挖掘 中 


的 应 用 


引用 对 象 表示 他 人 对 引文 研究 成 果 的 引用 ,具有 
知识 表示 和 知识 传播 两 种 特征 。 引 用 对 象 的 利用 主要 
分 为 两 种 情况 ,一 种 是 利用 引用 对 象 与 被 引 频 次 相 结 
合 进 行 引文 分 析 , 从 知识 传播 和 继承 的 角度 ,分 析 引 文 
的 学 术 贡 献 和 影响 。 另 一 种 是 利用 引用 对 象 作 为 重要 
特征 ,融入 文本 挖掘 算法 ,提高 文献 检索 .自动 摘要 等 
应 用 效果 。 有 目前 引用 对 象 的 应 用 主要 基于 人 工 标注 数 
据 , 受 限于 标注 成 本 ,应 用 规模 较 小 , 仅 处 于 探索 和 党 
试 阶 段 。 

科技 文献 对 学 术 界 的 主要 贡献 可 以 通过 学 术 共 同 
体 对 其 引用 和 引用 它 时 的 描述 信息 揭示 ,引用 对 象 天 
生 承 载 着 这 部 分 信息 ,在 引文 分 析 和 科研 评价 方面 具 
有 先天 优势 。M. H. Anderson 等 利用 引用 对 象 和 被 引 
频次 从 定性 和 定量 相 结合 的 方式 ,分 析 一 篇 管理 学 高 
被 引 论文 的 学 术 贡献 ” 。 引 用 对 象 的 标注 过 程 , 首 先 
汇总 高 被 引 论文 的 全 部 引用 名 ,总结 被 提 及 的 主要 贡 
献 , 再 把 这 些 贡 献 映射 回 每 条 引用 句 ,作为 该 引用 名 的 
引用 对 象 。 这 样 的 标注 方法 在 标注 的 同时 规范 了 引用 
对 象 的 表达 ,有 利于 后 期 深入 利用 分 析 。 

应 用 方面 ,M. H. Anderson 等 把 标注 的 引用 对 象 与 
出 现 频次 相 结合 分 析 了 高 被 引 论文 的 主要 学 术 贡 献 ， 
并 且 通 过 分 别 计算 七 个 不 同学 科 的 施 引 文献 中 引用 对 
象 占 比 情况 ,比较 发 现 该 高 被 引 论文 在 不 同学 科 的 影 
响 并 无 较 大 差异 。 尤 其 在 管理 和 计算 机 这 两 个 主要 学 
科 , 三 个 最 常 被 引用 的 引用 对 象 非常 相似 。 这 种 内 容 
与 数量 联合 测度 论文 贡献 的 方法 弥补 了 传统 引文 分 析 
方法 的 不 足 , 为 科学 计量 及 科研 评价 提供 了 新 思路 。 

除 增强 引文 分 析 方 法 外 ,引用 对 象 体现 了 其 他 研 
究 人 员 对 引文 成 果 的 总 结 和 刻画 ,利用 这 一 特点 引用 
对 象 被 应 用 在 文献 检索 .自动 摘要 、 情 感 分 析 等 领域 。 
A. Ritchie 等 认为 引用 句 中 与 引文 相关 的 术语 在 构建 
一 篇 引文 的 索引 词 时 具有 重要 作用 ,尝试 把 引用 文献 
的 引用 对 象 与 该 文献 本 身 的 索引 词 结合 起 来 ,并 举例 
证 明 引 用 对 象 的 加 入 更 好 的 描述 了 论文 内 容 ” V. 


马 娜 , 张 智 雄 , 于 改 红 . 科技 论文 引用 对 象 研究 综述 []]. 图 书 情报 工作 ,2019 ,63(23 ) :139 - 145. 


Qazvinian 等 在 利用 引用 内 容 自 动 生成 论文 摘要 时 , 利 
用 引用 对 象 确 定 引 文 的 重要 贡献 ,除去 重复 引用 内 容 ， 
提高 自动 摘要 的 准确 性 和 完整 性 ; R. Jha 等 在 V. 
Qazvinian 的 启发 下 ,利用 引用 对 象 及 其 出 现 的 次 数 作 
为 权重 加 入 论文 摘要 生成 模型 ,有 效 地 提升 了 摘要 生 
成 效果 后 。 许 德 山 在 研究 语 篇 链 路 引用 情感 时 ,首先 
识别 引用 对 和 象 并 进行 对 象 消 卜 , 通 过 信息 在 句子 间 传 
递 的 方式 构建 引用 对 象 语 篇 链 路 进而 完成 引文 评价 情 
感 链 路 分 析 ' 。 


6 总结 与 展望 


引用 对 象 从 内 容 层面 揭示 引文 的 学 术 价 值 ,弥补 
了 传统 以 数量 评价 质量 的 引文 分 析 方法 的 不 足 , 具 有 
重要 的 理论 意义 和 应 用 价值 。 本 文 从 理论 .应 用 和 技 
术 室 个 层面 梳理 科技 论文 引用 对 象 研究 进展 ,不 难看 
出 0 用 对 象 的 概念 在 逐步 明确 ,分 类 体系 研究 初 见 成 
演 : 介 在 自动 化 识别 和 应 用 方面 存在 明显 不 足 。 总 体 
汀 省 ,引用 对 象 研究 正 处 于 初期 探索 阶段 ,已 有 研究 远 


布 能 实现 引用 对 象 大 规模 应 用 的 目标 ,还 有 许多 研究 
值得 进一步 探索 与 深化 。 
和 ~ 在 理论 上 ,从 多 维度 加 强 引用 对 象 特征 的 研究 和 
所 ,进一步 明确 引用 对 象 的 本 质 。 一 个 科学 问题 在 
hf 外 初期 ,理论 研究 待 逐步 完善 ,引用 对 象 需要 更 多 理 
论 福 究 支撑 大 规模 识别 和 应 用 。 引 用 对 象 作为 知识 泛 
信用 未 对 象 ,在 表现 形式 上 具有 统计 学 特征 ,包括 词性 
RIE .在 引用 名 中 承担 的 句法 成 分 .与 引用 标签 的 位 置 
XR .语言 模型 特点 等 。 从 语言 学 角度 深入 分 析 引 用 
对 医 导 点 ,有 助 于 深入 、 客 观 地 理解 引用 对 象 。 另 外 ， 
不 同学 科 论 文 的 引用 对 象 特点 分 析 也 是 一 个 有 价值 的 
研究 问题 。 受 全 文 获取 限制 ,已 有 研究 大 部 分 基于 计 
算 机 领域 ,引用 对 象 在 其 他 学 科 特 征 是 否 一 致 不 得 而 
知 ,多 领域 的 引用 对 象 特征 对 比 研究 非常 必要 。 

在 技术 上 ,探索 基于 大 规模 语 料 的 引用 对 象 自动 
化 识别 方法 。 目 前 引用 对 象 自动 化 识别 成 果 十 分 有 
限 , 笔 者 认为 主要 有 两 方面 原因 ,一 方面 由 于 引用 对 象 
是 施 引文 献 作 者 对 引文 内 容 的 转述 ,主观 性 较 强 ; 另 一 
方面 缺少 大 规模 高 质量 的 测评 语 料 , 不 利于 研究 的 开 
展 。 技 术 方 面 ,笔者 认为 引用 对 象 识别 可 以 转化 为 序 
列 标注 问题 ,可 以 尝试 HMM"! , CRF?" LSTM -CNNs - 
CRF" BERT 等 在 序列 标注 问题 上 取得 不 错 效 果 
的 模型 。 数 据 集 方面 ,基于 科技 文献 构建 具有 一 定 规 
模 的 高 质量 研究 数据 集 ,由 论文 .引文 .引用 句 和 引用 
对 象 组 成 的 结构 化 数据 ,具有 数据 结构 清晰 ,样本 形式 


丰富 ,标注 质量 高 .易于 获取 等 特点 。 针 对 目前 训练 数 
据 量 较 少 的 情况 ,可 以 考虑 采用 半 监 督学 习 ” 或 迁移 
学 习 ”等 不 同 策略 ,适当 降低 模型 对 训练 数据 量 的 要 
在 应 用 上 ,借助 自动 化 识别 技术 ,提升 语义 化 引文 
分 析 应 用 效果 ,尝试 基于 引用 对 象 的 科研 评价 服务 。 
引用 对 象 体现 了 论文 在 科学 研究 中 的 学 术 价 值 和 贡 
献 , 这 是 其 他 引用 内 容 不 具备 的 。 引 用 对 象 定性 分 析 
与 传统 基于 被 引 频 次 的 定量 引文 分 析 方 法 结合 ,完善 
科研 评价 体系 ,是 引用 对 象 最 根本 也 是 最 重要 的 应 用 
方向 。 自 动 化 识别 效果 的 不 断 提升 ,为 深入 内 容 的 引 
文 分 析 呐 定 坚 实 基础 ,使 基于 引用 对 象 的 科研 评价 服 
务 成 为 可 能 ,同时 从 应 用 角度 反观 技术 需要 改进 之 处 ， 
二 者 相互 促进 。 利 用 大 规模 引用 对 象 建立 语义 化 实体 
级 引用 网 络 ,可 以 快速 实现 学 术 论 文 贡献 分 析 ,挖掘 领 
域 经 典 理论 .重要 算法 或 广泛 应 用 的 数据 集 ,探索 交叉 
学 科学 术 交 叉 点 ,构建 知识 流动 路 径 。 
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Abstract; [ Purpose/significance | In order to improve the effect of content-based citation analysis, this paper sum- 
marizes the related research on citation object at home and abroad, and provides reference for citation content analysts. 
[| Method/ process | By investigating the related research on citation object at home and abroad, this paper reviewed the 
definitions of the citation object, classification systems, application fields and automatic identification, summarized the 
current research on the citation object and put forward the future development direction. [ Result/conclusion | The cita- 
tion object evaluates the contribution and utilization value of academic research from the semantic level, which adds an im- 
portant dimension to the citation analysis method. The research on citation object needs to be deepened in three direc- 
tions; theoretically, to strengthen the research and analysis of multi -dimensional citation object features; technically, to 
explore the automatic identification methods based on large-scale corpus; application , to try to provide scientific research 
ecalüation services based on citation objects. 
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2019 4 12 月 6 日 ,在 2019 年 图 书 情报 与 档案 管理 研究 生 教育 论坛 与 青年 学 者 论坛 召开 期 间 , 在 武汉 大 学 信息 
iid ic F , (IB WRTA) KTERE E A o E RE EE DUE EDUC E IS. 
A 由 青年 编 委 会 主任 ` 武 汉 大 学 信息 管理 学 院 副 院 长 ,教育 部 青年 长 江 学 者 陆 伟 教授 主持 并 发 言 ,他 认为 青年 
aes sanum: 书 情报 工作 》 杂 志 社 开拓 进取 、 勇 于 创新 的 精神 ,更 重要 的 是 体现 了 对 青年 学 者 的 重视 ,关心 和 
支持 ,青年 人 才 的 成 长 离 不 开 期 刊 ,无 论 是 发 表 论文 还 是 参与 审 稿 都 是 个 人 学 术 成 长 道路 中 的 重要 步骤 ,并 借 此 机 会 对 (图 书 
情 据 工 作 》 杂 志 社 表 示 感 谢 。《 图 书 情报 工作 》 杂 志 社 社 长 兼 主编 ,中 国 科学 院 大 学 图 书 情报 与 档案 管理 系 主任 初 景 利 教授 介 
绍 了 青年 编 委 会 的 成 立 背景 和 章程 青年 编 委 的 遂 选 原则 ,权利 与 职责 。 首 届 青 年 编 委 会 共 邀 请 来 自 全 国 不 同 高 校 的 23 位 青 
年 才 俊 , 旨 在 充分 发 挥 他 们 的 学 术 研 究 能 力 和 创新 能 力 , 为 期 刊 发 展 注入 新 的 活力 ,同时 也 为 青年 学 者 提供 发 展 和 成 长 的 平 
台 。 随 后 初 主编 向 到 会 的 17 位 青年 编 委 颁发 了 聘书 。 接 下 来 ,在 编 委 会 副 主 任 , 华 中 师范 大 学 信息 管理 学 院 副 院 长 曹 高 省 副 
教授 主持 下 ,与 会 编 委 围绕 (图 书 情报 工作 》 改 名 设想 ,期 刊 定位 、 图 情 档 学 科 的 未 来 发 展 方向 ,学 科 建 设 与 人 才 培养 .期 刊 需 
要 关注 的 问题 ,办 刊 举措 等 积极 建言 献策 ,展开 了 热烈 研讨 。 
青年 学 者 往往 拥有 良好 的 教育 背景 旺 感 的 学 术 精 力 敏锐 的 学 术 眼 光 ,他 们 代表 着 图 情 学 研究 的 未 来 ,在 学 科 和 事业 奸 
设 中 被 寄予 重任 和 厚望 。 本 次 (图书 情报 工作 青年 编 委 会 的 成 立 恰 着 其 时 ,期 望 编 委 们 与 和 《图 书 情报 工作 ) 一 起 努力 ,为 提 
刊 质量 和 学 术 影响 力 ,为 推动 业界 学 界 的 学 术 研究 和 图 情 档 事业 的 发 展 ,做 出 应 有 的 贡献 。 
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《图 书 情 报 工作 》 首 届 青 年 编 委 会 名 单 
x od 陆 伟 
WX WAME WKB Ha 
委 员 ( 按 姓氏 拼音 排序 ) 
戴 艳 清 “ 邓 胜利 ” 樊 振 佳 范 炜 wh 何 琳 胡 莹 刘 晓 娟 裴 雷 王 铮 魏 来 吴 丹 张 靖 WIE 张卫东 
张 云 中 GENES KFA KE 
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